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Chapitre 1 

Introduction 



Le thème central de ma recherche est le dénombrement, la distribution et la 
croissance d'objets discrets dans des structures algébriques. Les travaux décrits dans 
ce mémoire peuvent être classifiés de la manière suivante : 

(a) La croissance dans les groupes : [Hel08aJ, [H elllj . |GH11| . |GH| . |HS| ; 

(b) Les points entiers et rationnels sur des courbes : |HV06] . |HV09] . |Hel07| ; 

(c) Combinatoire additive classique : [HdRllJ, |HR11| ; 

(d) Théorie analytique et probabiliste des nombres : [Hel07j, [Hel08bJ ; 

(e) Théorie algorithmique des nombres : |TCH| . 

Tous les travaux cités ci-dessus sont postérieurs à la thèse [Hel03j. L'article |Hel04| . 
issu de cette dernière, constitue un premier pas vers (HV06J. 

(a) La combinatoire additive, l'expansion dans les groupes arithmétiques et l'étude 
du diamètre des groupes finis avaient évolué comme trois domaines disjoints. Leur 
liaison dans [Hel08aJ - laquelle, en particulier, a établi la conjecture de BABAI sur 
les petits diamètres pour les groupes G = PSL2(Z/pZ) - a initié une période d'in- 
tense activité |BG08bj . |BG08a| . [Dm], |Helllj . |GHllj . [VâT] . [PS] . |BGT], |GH] . 
[SGVl.0 Ces travaux, néanmoins, étaient tous restreints au cas de groupes linéaires 
de rang borné. Très récemment, [HSJ a donné une borne quasipolynomiale pour le 
diamètre du groupe symétrique Sym(n). Le traitement de ce cas fondamental se base 
sur un développement d'idées dans plusieurs domaines, comme la croissance dans les 
groupes, la structure des groupes de permutation et les marches aléatoires. 

(b) Soit C une courbe définie par une équation avec coefficients dans Q. Combien 
de points entiers et rationnels jusqu'à une certaine hauteur peut-il y avoir sur C? Il 
y a des bornes |BP89| prouvées à partir de la géométrie de la courbe comme sous- 
ensemble de M 2 , et des bornes f |Mum65| . |5Tl87] . |GS95j . |Hel04j ) qui exploitent la 
géométrie, voire la norme naturelle, du réseau de Mordell-Weil de C (en genre positif). 
La méthode suivie dans |HV06| (avec A. VENKATESH) réussit à combiner des idées 
des deux types. Parmi les applications se trouvent des bornes non-triviales pour le 
nombre de courbes elliptiques de conducteur donné et pour la 3-torsion dans des 

1. Cette liste ne prétend pas être complète. 
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groupes de classe |HV06| . Une approche similaire est un des éléments qui conduisent 
à des résultats sur les valeurs f(p) (/ cubique) sans facteurs carrés ( |Hel07| . |Hel08b] ; 
voir ci-dessous). Par ailleurs, le transfert d'idées sur la géométrie des courbes dans 
IR 2 dans le contexte du larger sieve de GALLAGHER |Gal71| conduit à une forte 
dichotomie entre cardinalité et structure algébrique en Z 2 [HV09J. 

(c) Dans le cas classique, c'est-à-dire les groupes abéliens, la combinatoire additive 
peut arriver à combiner des idées de l'analyse de Fourier avec la théorie analytique 
des nombres. Une telle combinaison a conduit à une amélioration sensible [HdRÎT] du 
résultat de GREEN |Gre05| sur les progressions arithmétiques de longueur 3 dans tout 
sous-ensemble dense des nombres premiers. Une approche arithmétique-combinatoire 
s'est montrée suffisante pour donner des bornes explicites pour un théorème d'inci- 
dence sur F p jHRllj . 

(d) Les articles |Hel07j . |Hel08bj prouvent une conjecture d'Erdôs [Erd53j selon 
laquelle, pour tout polynôme cubique / G Z[x] satisfaisant des conditions locales 
nécessaires, il y a un nombre infini de nombres premiers p tels que f(p) soit sans 
facteurs carrés. La preuve repose en partie sur des méthodes de comptage de points 
sur des courbes (similaires à celles dans |HV06| ) et en partie sur des méthodes pro- 
babilistes d'un type peut-être nouveau en théorie des nombres. Par exemple, |Hel07| 
utilise le fait qu'il y a deux distributions incompatibles pour deux valeurs reliées - 
l'argument et la valeur de f(x). Dans un tel cadre, la preuve dans |Hel08b| utilise 
une conséquence de la modularité de y 2 = f(x) : le terme d'erreur dans l'estimation 
de Hasse-Weil existe réellement en moyenne, et donc peut être exploité. 

(e) Il est possible de vérifier rapidement si un nombre n est premier - ceci est 
classique si on permet une méthode probabiliste, et connu depuis |AKS04| de manière 
déterministe. Par contre, s'il s'agit de trouver un nombre premier entre iV et 2N, 
il reste une grande différence entre les deux régimes : si on permet un algorithme 
probabiliste, le problème se réduit a celui de la vérification en temps O(logn) de 
manière triviale, mais, même sous l'hypothèse de Riemann, il n'est pas évident de 
faire mieux que O (n 1 / 2+e ) de manière déterministe. Dans |TCH| - un article issu du 
projet Polymath de collaboration massive - une méthode déterministe basée sur une 
analogie avec des approches combinatoires au problème des diviseurs de DlRICHLET 
(voire le problème du cercle de GAUSS) accomplit la tâche en temps O (n 1 / 3-1-6 ) sans 
utiliser l'hypothèse de Riemann, en supposant que le nombre de nombres premiers 
entre N et 2N soit impair. 

Note (12 déc 2011). Je remercie les membres du jury - N. Anantharaman, E. 
Fouvry, M. Hindry, E. Kowalski et P. Pansu - pour ses questions et ses commentaires. 



Chapitre 2 

Croissance et diamètre 



2.1 Résultats principaux 

Soit G un groupe, icGun sous-ensemble fini. On écrit 

A" 1 = {g' 1 :geA}, A-A = { 9l -g 2 : g x ,g 2 G A}, 

A ■ A ■ A = {gi • g 2 ■ g 3 : 51,92,93 G -4}, A fe = {9192 ■■■ 9k '■ 91,92, ••• ,9k € A }. 

Rappelons que A est un ensemble de générateurs de G (ou : (A) = G) si tout 
élément de G peut être écrit comme un produit d'éléments de A et ses inverses, i.e., 
si G = Ufc>o(^ U Ar l ) k . A partir de maintenant nous supposons, pour simplifier, 
que A = A^ 1 et e G A, où e est l'identité de G. 

Si (A) = G, on définit le graphe de Cayley (non-orienté) T(G, A), dont l'ensemble 
de sommets est G et l'ensemble d'arêtes est {{g, ag} :jéG,«£ A}. Cette définition 
permet de formuler certains concepts de manière géométrique. La longueur d'un 
chemin dans un graphe est tout simplement le nombre d'arêtes dans le chemin ; la 
distance d(x, y) entre deux points est le longueur du chemin le plus court entre eux. 
Le diamètre diam(r) d'un graphe T est le maximum de d(x,y), où x, y parcourent 
tous les sommets du graphe. Il est facile de voir que la distance entre g G G et h G G 
dans un graphe de Cayley est l'entier non-négatif k minimal tel que gh- 1 G A k . 
Donc, le diamètre de T(G,A) est l'entier non-négatif k minimal tel que G = A k . 

Le diamètre diam(G) d'un groupe fini G est le maximum de diam(G, A) quand 
A parcourt tous les ensembles de générateurs A de G. 

Théorème 1 ( |Hel08a| ). Soit G = SL 2 (Z/pZ). Alors 

diam(G) < (log|G|)° (1) , 
où la constante implicite est absolue. 

(Ici et dans le reste, \S\ dénote le nombre d'éléments d'un ensemble S.) La preuve 
de ce théorème repose sur la proposition suivante : 
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Proposition 2. ( ]HeW8ai "Key Proposition"}) Soit G = SL 2 (Z/pZ). Soit A C G, 
(A) = G. Si \A\ < |C| 1 - e pour e > 0, alors 

\A - A - A\> \A\ 1+S , 

où 5 > dépend seulement de e. 

L'itération de cette proposition conduit directement au Théorème [T] La Propo- 
sition |2] a été vite utilisée pour construire des graphes expanseurs QBG08bJ ; voir 
aussi les applications dans [BGSTÔ]) et généralisée à des autres groupes du même 
type de Lie (SL 2 (F g ) [Dm] et SU 2 [BG08a] V Dans [Helll] . j'ai généralisé Prop. |2]et 
Théo. [T] à SL3(Z/pZ), tout en traçant les lignes à suivre pour prouver un énoncé plus 
général. Il y a eu une série de généralisations ultérieures - [G Hll] et en suite [BGTJ 
et |PS] - de telle manière que maintenant on connait Prop. [2] et Théo. [T]pour tous 
les groupes simples de type de Lie et rang borné. (Autrement dit - le rang peut être 
arbitrairement grand, mais [BGTj et [PS], même comme |GH11] . gardent une forte 
dépendance du rang dans ses bornes.) Des résultats similaires ont été prouvés pour 
les groupes résolubles [GHJ. 

En général, un énoncé comme le Théorème [T] doit être vrai pour tous les groupes 
simples finis et non-abéliens (conjecture de BABAl). Il restait donc à prouver deux 
cas : les groupes simples de type de Lie et rang non-borné, et les groupes alternés 
Alt(n). Les deux problèmes sont reliés : Alt(ra) apparaît dans les groupes de Weil 
des groupes de type de Lie, et la généralisation la plus naïve de la proposition [2] est 
fausse dans les deux cas ; il y a même des contre-exemples similaires dans un cas et 
l'autre [PS], [PPSS] , 

Le résultat suivant est très récent. Sa preuve présente une série de nouveaux argu- 
ments utilisant à la fois des idées inspirées de [Helll] comme des résultats antérieurs 
dans le domaine des groupes de permutation. 

Théorème 3 ([HS]). Soit G = Alt(ra) or G = Sym(n). Alors 
di a m(G)< e ( l0 ^) 0(1) =e^ l0 ^ G l) 0(1) . 

Plus précisément, diam(G) < exp(0((log n) 4 (log log n))) ; où la constante implicite 
est absolue. 

Par [BS92] . la borne 

diam(G) < exp(0((logn) 4 (loglogn))) 
suit immédiatement aussi pour tout groupe transitif de permutation sur n éléments. 

2.2 Domaines et Perspectives 

Jusqu'à [Hel08aJ, chacun des trois domaines suivants paraissait disjoint des autres. 
Jusqu'à [HSJ, le dernier l'était encore. 



(a) Diamètre et spectre dans les groupes arithmétiques. Il y avait quelques résultats 
classiques pour des générateurs spécifiques. Par exemple, soit 

Le théorème de SELBERG sur le trou spectral en SL2(Z)\EI QSel65]) implique 
que {r(SL2(Z/pZ), A)} p >§ est une famille de graphes expanseurs (voir, e.g., 
|Lub94| . Thm. 4.4.2, (i)). En particulier, diam(r(SL 2 (Z/pZ, A))) <C logp. Mal- 
heureusement, cet argument ne marche pas pour A plus général. Par exemple, 
il n'y avait pas des bonnes bornes pour diam(r(SL2(Z/pZ, A))) avec, par 
exemple, 




(2.2.2) 



(un exemple favori de LUBOTZKY). 

(b) Combinatoire additive. Soit A un sous-ensemble des entiers (ou d'un groupe 
abélien). Que pouvons-nous dire sur la taille de A + A = {x + y : x, y G A} ? 
Si A + A n'est pas beaucoup plus grand que A, que pouvons-nous dire sur la 
structure de A? (Freiman, Ruzsa,. . .) 

(c) Graphes de Cayley des groupes de permutation. Soit G < Sym(n) un groupe 
de permutation, A un ensemble de générateurs. Le diamètre diam(r(G, A)) 
est-il polynomial (= n 0<yl ^)l Quasipolynomial (= exp ((logn) ^ 1 ))) ([BS92, 
Conjecture 1.6]) ? Il avait des bornes sous certaines conditions [BBS04J, des 
bornes pour des générateurs aléatoires [BH92] , |BH05] , et une réduction au cas 
G = Sym(n) [BS92J, mais les bornes pour des générateurs arbitraires restaient 
très loin des conjectures ([BS88J, borne exponentielle en \/n). 

L'article [Hcl08aJ a résolu un problème de type (jâj) pour A complètement arbi- 
traire en utilisant des méthodes de type ([b"]) . Ceci a mené à des développements sur 
le trou spectral (la plus petit valeur propre non-nulle du Laplacien du graphe de 
Cayley) : |BG08b| . |BGS10| . etc. Récemment, BOURGAIN, Gamburd et Sarnak 
[BGSj ont réussi à inverser la procédure utilisée jadis pour (jâj) : ils déduisent des 
trous spectraux sur les surfaces r \ H à partir du résultat combinatoire dans |Hel08aJ 
(via |BG08b| ). 

La preuve dans |HSj lie les méthodes en (jçj) avec les arguments développés à par- 
tir de [Hcl08aJ et [HelllJ. Une idée motrice est l'examen de la croissance comme un 
concept relatif, c'est-à-dire, en termes d'une action G — > X, pas seulement comme 
un phénomène dans un groupe G. Les arguments en |Hel08a| . jHelllj . [Dm], |GH11| . 
[BGT] . |PS| peuvent être encadrés (à partir de |Hel08aj §4]) en termes de l'action de 
G sur lui-même par conjugaison ou (dans |Helllj §4.1 et §7.1]) simplement par mul- 
tiplication ; en rétrospective, [BBS04J et autres travaux dans le domaine (jçj) peuvent 
être mis dans un cadre similaire en relation à l'action naturelle de G = Sym(ra) sur 
X = {1, 2, . . . , n}. Les deux types d'action se mêlent dans |HS] , 



2.3 Outils et idées 



2.3.1 Analogies. Adaptations. 

Deux analogies ont joué un rôle important dans le développement de ce qu'on 
peut nommer la combinatoire arithmétique non-commutative - spécialité qui a ses 
origines dans [Hel08a] et [Tào08j. 

(a) Analogues non-commutatifs d'énoncés de combinatoire additive. Pour prouver 
la Proposition [2j on prouve \A k \ > \A\ 1+5 ', k une constante, et on en dé- 
duit que \A • A ■ A\ > |A| 1+<5 ; ce dernier pas est possible grâce à l'inégalité 
du triangle de RlJZSA, généralisée aux groupes non commutatifs dans [Hcl08a, 
§2.3] et [Tao08, §3]. L'article [Tao08j contient aussi une généralisation aux 
groupes non-commutatifs du théorème de BALOG-SZEMERÉDI-GOWERS (voir 
aussi [SSV05J) ; cette généralisation a été utilisée ensuite dans le passage d'en- 
sembles aux mesures dans |BG08b| §3]. 

(b) Analogues pour des ensembles d'énoncés sur des sous-groupes. Un bon nombre 
de résultats sur des sous-groupes d'un groupe G peuvent être adaptés à des 
sous-ensembles A de G. Un exemple simple mais central est donné par le théo- 
rème d'orbite-stabilisateur. 

Lemma 4 (Théorème orbite-stabilisateur pour ensembles). Soit G un groupe 
qui agit sur un ensemble X. Soit x G X, et soit A C G non-vide. Alors 

\AA~ l nG x \ > M 
\x A \ 

De plus, pour tout B C G, 

\AB\ > \AnG x \\x B \. 

Ici G x dénote le stabilisateur de x dans G, et x B dénote l'orbite de x sous 
B C G. Le théorème d'orbite-stabilisateur usuel est le cas spécial A = B = H , 
H un sous-groupe de G. La preuve, à la fois ici comme dans le cas traditionnel, 
est un simple exercice. 

Ce principe est déjà plus ou moins implicite dans [Hel08"â] Prop. 4.1], dans le 
sens que la tension entre le centralisateur C(g) (le stabilisateur d'un élément 
g G G sous l'action de G sur soi-même par conjugaison) et le nombre de 
classes de conjugaison (le nombre d'orbites dans la même action) est décrite et 
exploitée. 

L'analogie (jb]) a été appliquée aussi dans |BG| . |Hru| (théorie des modèles) 
et [BGTJ, entre autres. Deux régimes sont utilisés couramment : celui des en- 
sembles A avec \AAA\ < \A\ 1+S (dans |Hel08a| . jHelllj . |GH11| . etc.) et celui 
des ensembles appelés approximate groups QTao08j, [BGJ, [BGTJ, etc.). Les 
deux régimes sont à peu près équivalents ( |Tao08| Thm. 3.8]). 
La preuve de fH3] confirme l'importance de l'analogie (|E]) et suggère qu'elle dé- 
passe les deux cadres utilisés jusqu'à maintenant. Considérons, en particulier, la 
généralisation dans |HS| §5] du splitting lemma de BABAI [Bab82, §3]. 



- Il était déjà clair que des assertions sur des sous-groupes basées sur des argu- 
ments quantitatifs robustes pouvaient être adaptées a des sous-ensembles (voir 
Lemma H]). Ce qui se révèle robuste dans |HS| §5], par contre, n'est pas un 
argument quantitatif, mais un argument probabiliste, grâce au fait qu'une dis- 
tribution uniforme puisse être simulée par un processus de complexité bornée, 
à savoir, une marche aléatoire. 

- Les énoncés dans |HS| §5] ne paraissent pas entrer de façon naturelle ni dans 
le formalisme |AAA| < |A| 1+<5 ni dans celui des "approximate groups". Il s'agit 
plutôt (comme dans [Hel08a[ §4], |HellH §5] et ailleurs) d'énoncés qui rem- 
placent parfois A par A k , là où un énoncé sur des sous-groupes H utiliserait 
toujours H (car H k = H). Ce cadre paraît être le plus simple et flexible. 

2.3.2 Intersections avec des sous-varietés 

Pour G un groupe algébrique linéaire défini sur un corps K, un tore est un groupe 
algébrique isomorphe au produit d'un nombre fini de copies du groupe multiplicatif 
G m . Un élément g G G(K) est régulier semi-simple si et seulement si son centrali- 
sateur est un tore maximal. (Par exemple, si G = SL n , un tore est un sous-groupe 
isomorphe (par conjugaison dans G{K)) au groupe des matrices diagonalisables, et 
un élément est régulier semi-simple si et seulement si il a n valeurs propres distinctes.) 

Proposition 5. ( JHelll\ Cor. 5.4 et Cor. 5.10]) Soit G C GL n un groupe classique^ 
sur un corps K. Soit A C G(K), {A) = G(K), A = A~ l , e G A. 

Il y a une constante k qui dépend seulement de n telle que, pour tout tore maximal 
T/K, 

\A n T(K)\ < n |^Y im(T)/dim(G) . (2.3.1) 
En plus, il y a un g E A k régulier semi-simple tel que 

\A k n T(K)\ > n ■ |^| dim ( T )/ dim (G) (2.3.2) 
\ A I 

où T est le centralisateur de g. 

Comme il a été remarqué dans |HellH §5.3, Remark], la preuve en [Hell lj donne 
(|2.3.2p pas seulement pour un seul g, mais pour beaucoup de g possibles. Dans 
|Helll| . des résultats du type (|2.3.ip ont été aussi prouvé pour des tores non maxi- 
maux et autres sous-groupes. 

|PS] et |BGT| ont amélioré la Proposition [5] en prouvant (|2.3.2p pour tout élément 
g € A. Dans le cas de |BGT| . cette amélioration a été extraite de |LPllj .FI Larsen et 
PlNK avaient prouvé dans |LP11] , des résultats analogues à (|2.3.ip - pour des sous- 
groupes H en place de sous-ensembles A arbitraires, mais, par contre, aussi pour des 

1. Dans ce contexte, SL n , SO n ou Sp 2 „. La preuve dans [Hellll §5] s'applique aussi (au moins) à 
tous les groupes de Chevalley (Gill, non publié). L'énoncé de (|2.3.2l est prouvé en [§5]MR2781932 
seulement pour SL„ ; la même preuve est valide pour tous les groupes classiques. 

2. [LP11] existait en manuscrit depuis 1998. Hrushovski a joué un rôle dans sa diffusion. 



variétés V arbitraires en place de T. En particulier, en prenant V = Cl(g) (la clôture 
de Zariski d'une classe de conjugaison) et utilisant un argument du type orbite- 
stabilisateur, LARSEN et PlNK avaient prouvé dans |LP11| Thm. 6.2] une version de 
(|2,3,2p (pour A un sous-groupe) valide pour tout g £ A. 

Dans |Hel08a| . jHelllj . |GH11] . |BGT] . [PS] , la stratégie générale est la suivante : 
si A C G satisfait \A ■ A ■ A\ < |yl| 1+5 , ô > petit (c'est-à-dire, si A es un contre- 
exemple hypothétique à la Prop. [5]), alors les bornes inférieure et supérieure dans la 
Prop. [5] sont très proches l'une de l'autre. En étudiant des conjugués du tore T, on 
utilise cette connaissance excessive de la grandeur de A n T{K) pour arriver à une 
contradiction. 

2.3.3 Somme, produit, incidence, pivotement 

Mais comment arriver à une telle contradiction ? Dans [Hel08aJ , une identité pour 
des traces à été utilisée pour construire un sous-ensemble de Z jpL qui ne croît ni sous 
addition ni sous multiplication par lui-même, ainsi allant à l'encontre du théorème 
somme-produit QBKT04J, |Kon| ; £ 15. 2p . L'identité est valide seulement pour SL2 et 
autres groupes de rang 1. 

Dans |Helll| §3], une idée présente dans des preuves de théorèmes de type somme- 
produit ([GK07J, [Bou09j) a été développée et généralisée à des groupes (abéliens) 
agissant sur des groupes (abéliens ou non-abéliens) ; |Helll| a nommé cette idée 
pivoting (pivotement). Le plan original avait été de remplacer toute utilisation du 
théorème somme-produit par des résultats comme [HellU Prop. 3.1], qui utilise le 
pivotement dans le contexte d'action de groupes. Ce plan n'a pas réussi pour les 
groupes simples à l'époque (en rétrospective, cela est dû au fait que (|2.3.2p n'était 
pas prouvé pour tout g), mais il a marché (avec effort) pour des groupes résolubles 
[GHJ. A la place, [HelllJ a utilisé (et développé) des théorèmes d'incidence (dans le 
sens de Szemerédi- Trotter et |BKT04| ), Cette approche s'est avérée utile pour SL n 
dans |GH11| ; comme il a été remarqué dans [GHllJ, elle est valide aussi pour Sp 2n , 
mais, semble-t-il, pas pour SO n . 

L'argument dans |BGT| est tout à fait basé sur le pivotement. En [PSJ, une 
méthode essentiellement équivalente a été trouvée par une route indépendante, basée 
en partie sur des résultats sur la croissance en sous-groupes apparentés à ceux dans 
[HëTTTl §7.1]. 

Finalement - un argument crucial dans |HS| (le pas de création, [HS] Lem. 6.1]) a 
une certaine relation avec ce cercle d'idées. Le contexte relatif est légèrement différent 
- cette fois, l'action est celle d'un normalisateur Ne (H) sur un sous-groupe H < G 
(par conjugaison). 



Chapitre 3 

Points entiers dans le plan 



3.1 Points entiers sur des courbes 



3.1.1 Répulsion dans le réseau de Mordell-Weil 



Soit C une courbe donnée par une équation 



f(x,y) = 0, 



(3.1.1) 



où / G Q[x, y]. Le genre g de C est un entier > 0, égal au nombre de trous dans 
la surface de Riemann compacte associé. Si le genre de C est strictement positif, 
le nombre de points entiers sur C (c'est-à-dire, des points (x, y) G Z 2 satisfaissant 
(|3.1.ip ) est fini (théorème de SlEGEL). 

Donner une borne supérieure pour le nombre de ces points est une autre affaire. 
Les méthodes de SlEGEL ne sont pas effectives - elles ne peuvent donner aucune 
borne. Les travaux de BAKER donnent une borne sur la hauteur (naïve)0 des points 
entiers sur C, mais ceci ne donne q'une borne astronomique sur le nombre de points 
entiers. 

L'objet d'intérêt est autant le nombre total de points entiers sur C que le nombre 
de tels points entiers dans le carré [— N, N] 2 : 



Une famille de méthodes ( |Jar26j , |SI )7 lj. |Sch85] , |BP89j ) utilise la géométrie de 
l'ensemble de points (x,y) G Q 2 vu comme un sous-ensemble de M 2 . Les meilleures 
bornes de ce type sont celles de |IBP89| : 



où d est le degré de C. (Ici la notation <^. ej d implique, comme d'habitude, que la 
constante implicite dépend seulement de e et d.) 

1. La hauteur naïve h x (P) d'un point entier P = (x,y) sur une courbe dans le plan est tout 
simplement log \x\. 



{(x,y) G l-N,N} 2 HZ 2 : f(x, y) = 0}. 



(3.1.2) 



\{(x,y) G [-N,N] 2 HZ 2 : f(x,y) = 0}| « d , e N 1 /^ 



(3.1.3) 
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La méthode dans [BP89J peut être vue comme un analogue en haut degré du 
principe suivant : si un triangle a des sommets P, Q, R avec coordonnées entières, 
alors son aire appartient à (1/2)Z, et donc elle est au moins 1/2; par contre, si P, 
Q, R sont des points proches les uns aux autres sur une courbe C, alors ils sont 
presque colinéaires, et donc l'aire du triangle PQR est très petite. Ceci mène a une 
contradiction si P, Q, R sont très proches. Donc il ne peut pas y avoir trop de tels 
points dans une boîte [— N, N} 2 . 

Une deuxième famille de méthodes ([Mum65j, [Sil87j, [GS95J, [Hc-104]) se base 
sur la géométrie du réseau de Mordell-Weil - c'est-à-dire, le groupe abélien constitué 
par les points rationnels de la Jacobienne Jq de la courbe elliptique C. Dans le cas 
d'une courbe elliptique, la Jacobienne est isomorphe à C elle-même, et donc on peut 
travailler directement avec C : il y a une loi d'addition sur l'ensemble 

C(Q) = {(x,y) GQ 2 :/(x,y)=0} 

et cette loi fait de C(Q) un groupe abélien (PoiNCARÉ) avec un nombre fini de 
générateurs (MORDELL) ; alors C(Q) ~ Z r x T, où T est fini. Il y a une hauteur 
canonique sur C(Q), c'est-à-dire, une fonction h : C(Q) —> M telle que 

- la différence entre h(P) et la hauteur naïve h{P) = logmax(|a|, (pour 
P = (x,y), x = a/b, gcd(a, b) = 1) est bornée par une constante Oc(l) qui 
dépend seulement de C ; 

- h est une forme quadratique - en d'autres termes, h(P + Q) + h(P — Q) = 
2Îi(P) + 2h(Q) ; 

- h{P) = si et seulement si P est de torsion, i.e., P G T. 

Il est donc possible de définir une application t : C(Q) — > W avec |t(P)| = yJh(P). 
Cette procédure identifie C(Q) modulo T avec un réseau de W . 

Les points entiers sur C sont envoyés par l sur un sous-ensemble du réseau 
i(C(Q)). Quelles sont les propriétés de ce sous-ensemble? 

Si P, Q G C(Q) sont deux points entiers distincts avec |t(P)| ~ (1 ± e)|t(Q)|, 
alors t(P) et l(Q) doivent se repousser : l'angle Zl(P)Ol(Q) (où O est l'origine) est 
> 60° — 0{e) |Hel04| Lem. 4.17]. Un phénomène de répulsion a été déjà étudié par 
Mumford dans le cas de points rationnels sur des courbes de genre > 2 [Mum65] . Le 
phénomène observé dans [Hel04, §4] avait (en essence) été déjà remarqué dans [Sil87j, 
puis formulé et exploité de manière différente. Dans [Hel04] (et |HV06| . |Hel07] ). la 
répulsion est vue de manière géométrique et exploitée par le moyen de bornes sur 
l'empilement de sphères. (Le nombre de points possibles sur une sphère £ r _i C 
W séparés par des angles > 60° est égal au nombre de sphères qu'on peut placer 
autour d'une sphère du même rayon, i.e., le kissing number (nombre d'osculation). 
Les meilleures bornes asymptotiques pour le nombre d'osculation, soit pour 60°, soit 
pour un angle arbitraire, sont celles données par KABATJANSKlI et LEVENSTEÏN 
[KL78] . ) 

Dans |HV06| . cette répulsion est dérivée à partir de hauteurs locales A„, donc de 
manière plus proche de |Sil87] . |GS95] ; il s'agit de prouver des inégalités de type non- 
archimédien approché pour les hauteurs locales X v (grosso modo, \ V (P — Q) > (1 — 



e) min(A„(.P), X V (Q)), ce qui conduit à h(P — Q) > (1 — e) min(/i(P), h(Q)) pour P, 
Q entiers) |HV06( Lem. 3.1-3.3]. L'avantage de cette approche est une explicitation 
de la dépendance en C des bornes ; nous avons essayé de minimiser cette dépendance 
avec soin. 

Puis nous avons remarqué qu'on peut forcer h{P — Q) (et donc la répulsion) 
à augmenter en forçant P, Q à être proches l'un de l'autre dans pour une ou 
plusieurs places v |HV06| Lem. 3.1-3.3]. On obtient donc une borne (via |KL78| ) qui 
dépend d'un paramètre t qu'on a le droit de fixer - ce qui correspond à la taille de 
p, si on travaille avec un v = p fini. Dans notre énoncé f 1 1 \ *()(>! Thm. 3.8]), t = 
correspond à une borne "pure" (sans l'utilisation d'un v ou p) et t = 1 correspond à 
l'utilisation d'un p exactement de la taille nécessaire pour donner 90° de répulsion. 
Si t = 1, l'exposant de la borne obtenue est celui de Bombieri-Pila, à savoir, 1/d. 
Nous montrons après que, si on diminue p légèrement (t = 1 — ô), la borne est 
améliorée. Donc, on arrive toujours à obtenir un exposant meilleur que celui dans 
[BP89j .EI 

3.1.2 Applications 

La borne avec t = peut elle aussi être très utile, surtout pour borner le nombre 
total de points dans une courbe elliptique (sans restrictions sur la hauteur). La 
dépendance des bornes de la hauteur est si légère pour t = que, en combinant nos 
méthodes avec des bornes exponentielles sur la hauteur (HAJDU et HERENDI [HH98J, 
dans la tradition initiée par Baker), nous obtenons le résultat suivant. 

Proposition 6. (IHV06, Cor. 3.12]) Soit E une courbe elliptique définie sur Q 
par une équation de Weierstrass avec coefficients entiers. Alors, le nombre de points 
entiers sur E(Q) est 

O (|A| - 20070 -) , 

où A est le discriminant de l'équation de Weierstrass. 

Il est possible de prouver une borne similaire sur un corps de nombres K ar- 
bitraire, ou bien aussi pour le nombre de points S-entiers. (Un point S-entier est 
un point (x, y) G K 2 tel que x, y peuvent être écrits comme des fractions dont les 
dénominateurs sont divisibles seulement par des premiers dans l'ensemble S.) Nous 
en dérivons des bornes sur le nombre de courbes elliptiques de conducteur donné ; 
la famille de ces courbes est paramétrée par des points S-entiers sur une courbe 
elliptique. 

Proposition 7. (IHV06, Thm. 4-5]) Le nombre de courbes elliptiques sur Q de 
conducteur N est 

O (ATO-22377...) (3 L4) 

2. Néanmoins, les deux bornes ne sont pas directement comparables : Venkatesh et moi tra- 
vaillons avec la hauteur canonique h, Bombieri-Pila avec la hauteur naïve h x . Eliminer cette 
différence est très loin d'être trivial. Très récemment, mon étudiant en thèse (D. Mendes da 
Costa) a réussi à l'éliminer, et a donné en conséquence des bornes supérieures a celles en [BP89 
dans le sens stricte (pour les courbes elliptiques). 



Nous obtenons aussi (cette fois avec t 7^ soigneusement optimisé) des bornes sur 
la 3-torsion Hs(<Q(y/D)) (le sous-groupe qui consiste en les éléments g avec g 3 = 1) 
dans le groupe de classe de toute extension quadratique Q(\AD) de Q. Il y a dans cette 
situation un cercle vertueux : les bornes sur la 3-torsion conduisent à des meilleures 
bornes sur le nombre de points sur une courbe y 2 = x 3 + d, ce qui conduit à des 
meilleures bornes sur la 3-torsion, etc. 

Proposition 8. ( ]HV06\ Thm. 4-5f) Pour tout entier D non nul, 

\H 3 (Q(VD))\ « l^l - 44178 - (3.1.5) 

ELLENBERG et VENKATESH |EV07] ont déjà amélioré (j3.1.5|) . ce qui améliore 
immédiatement (|3.1.4p . car la preuve de Prop. [7] utilise (|3.1.5p . 

* * * 

Nos méthodes pour des courbes elliptiques sont aussi valides (avec des angles plus 
grands, donc meilleures bornes) pour des courbes de genre > 2. Ce fait est utilisé en 
|Hel07| . qui se sert aussi d'arguments probabilistes pour minimiser le coût de forcer 
P et Q à être proches p-adiquement (dans le contexte de courbes superelliptiques 
tyk-l — J(x), deg(/) = k, provenant du problème de valeurs polynomiales sans 
facteurs qui soient puissances (k — l)-èmes). 

3.2 La mauvaise distribution force-t-elle l'algébricité ? 

Soit S un sous-ensemble de Z n n [0, N] n . Examinons ce qui se passe si S est mal 
distribué modulo p pour beaucoup de nombres premiers p. (Par exemple, soit Sq C Z, 
et supposons que, pour chaque p plus grand qu'une constante, il y a au moins O.lp 
classes de congruence dans lesquelles il n'y a aucun élément de Sa.) Intuitivement, 
il est clair que les éléments de S sont atypiques, et donc S doit être petit. Peut-on 
quantifier et exploiter cette intuition ? 

Le grand crible et le crible majeur (c'est-à-dire le larger sieve de Gallagher 
[Gal71, Thm. 1]) donnent des bornes pour le nombre d'éléments \S\ de l'ensemble S 
dans ce type de situation. Par exemple, dans le cas de l'ensemble Sq défini ci-dessus, 
le crible majeur nous donne que 

\S \ « N - 9 , (3.2.1) 

où la constante implicite est absolue. Le grand crible va plus loin dans ce cas : 
[Bom74| Thm. 6] nous donne 

\S \ <JV 1 / 2 (logiV) c , (3.2.2) 

où c et la constante implicite sont absolues. 

Ces bornes sont-elles optimales ? Il y a des ensembles pour lesquels le grand 
crible et le crible majeur donnent tous les deux des bornes tout à fait optimales. Par 



exemple, soit Sq l'ensemble de tous les carrés jusqu'à N. Alors, pour chaque p, il y 
a (p — l)/2 (donc > O.lp) classes de congruence modulo p dans lesquelles il n'y a 
aucun élément de Sq. Bien entendu, \Sq\ = [-/V 1 / 2 ]. Donc, dans ce cas, (|3.2,2p est à 
peu près optimal. 

En même temps, cet exemple pourrait être une exception : les carrés sont loin 
d'être un ensemble arbitraire, puisque, évidemment, ils possèdent une structure al- 
gébrique très forte. Il est plausible qu'il existe une dichotomie claire [HV091 §4.2, 
"Guess"] : peut-être, si un ensemble évite beaucoup de classes de congruence mo- 
dulo p pour beaucoup de premiers p, soit l'ensemble est très petit, soit il a une forte 
corrélation avec une structure algébrique. VENKATESH et moi avons prouvé un tel 
résultat en dimension n = 2 : 

Théorème 9. Soit S C Z 2 n [0,iV] 2 , N > 1. Supposons que le nombre de résidus 
{(x, y) mod p: (x, y) G S} est < ap pour a > donné et tout p. 
Alors, pour tout e > 0, soit 

- \S\ N e , soit 

- il y a une courbe algébrique C dans le plan avec degré O a ^{l) telle que au 
moins (1 — e)^ points de S sont sur C . 

La preuve repose en partie sur de l'idée du crible majeur et en partie sur des 
méthodes reliées à celles de BOMBIERI-PlLA [BP89]. 

M. WALSH a réussi à généraliser le théorème a toutes les dimensions n > 2 [WalJ. 
Le cas n = 1 reste ouvert. 



Chapitre 4 



Théorie analytique et probabiliste 
des nombres 

Un entier n est dit sans facteurs carrés si d 2 \ n pour tout entier d > 1. Soit 
/ E Z[x] un polynôme. Dans la théorie des nombres, il est assez souvent convenable 
ou nécessaire de travailler avec des entiers sans facteurs carrés. Y a-t-il une infinité 
d'entiers n tels que f(n) soit sans facteurs carrés? 

Il est évident qu'il est nécessaire de demander comme condition que /(n) ^ 
mod p 2 aie des solutions dans Z/p 2 Z pour tout p (ce qui est certainement vrai pour 
p plus grand qu'une constante). Il est aussi évidemment nécessaire que f(n) n'aie pas 
de racines multiples (donc facteurs répétés, comme {x + 5) 2 ). Sous ces conditions, il 
est conjecturé qu'il y a une infinité d'entiers n tels que f(n) soit sans facteurs carrés. 
Ceci est trivial pour deg(/) = 1, classique pour deg(/) = 2 |Est31| . connu pour 
deg(/) = 3 (ErdôS, |Erd53j ) et ouvert pour deg(/) > 3 (mais prouvé dans [Gra98j 
de façon conditionnelle, sous la conjecture ABC). 

La preuve d'EîtDÔS pour deg(/) = 3 évite astucieusement plusieurs questions 
difficiles en géométrie diophantienne. Peut-être en conséquence, ERDÔS a demandé 
si on pouvait prouver que f(p) est sans facteurs carrés pour une infinité de premiers p : 
ceci rend ses propres astuces inutiles, et au moins quelques questions diophantiennes 
doivent être alors adressées. 

Théorème 10. (IHel08bl) Soit f G Z[x] un polynôme cubique sans racines multiples. 
Supposons que, pour tout nombre premier q, il y une solution x G (Z/p 2 Z)* à f(x) ^ 
modp 2 . Alors il y a une infinité de nombres premiers tels que f(p) est sans facteurs 
carrés. 

En plus, [Hel08bJ calcule la proportion (positive, sous les conditions) de nombres 
premiers p tels que f(p) soit sans facteurs de carrés. 

La partie difficile du problème est de prouver que f(p) peut avoir un grand 
diviseur carré du type q 2 , q premier, seulement pour une proportion o(l) des nombres 
premiers p. L'expression 

dq 2 =f(p) (4.0.1) 
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rend le lien avec les courbes elliptiques dy 2 = f(x) évident. (Dans cette perspective, 
il est possible de réinterpreter le travail de HOOLEY |Hoo76| Ch. IV] comme une 
approche exclusivement locale à un problème de comptage, Le., une approche qui ne 
prend pas avantage de la non- validité du principle de HASSE.) 

Par des méthodes basées sur la répulsion (développées dans |HV09j ; voir A3. Il de 
ce mémoire), le nombre de points entiers sur dy 2 = f(x) est petit (<C (log N)°^) 
pour tout d ayant (a) O(loglogiV) facteurs premiers et (b) un grand diviseur do\d 
(do S> N 1 ~ e ) avec O(eloglogiV) facteurs premiers. Il n'est pas difficile à prouver 
que ceci est le cas pour une proportion 1 — o(l) de tous les d, et aussi pour tout 
d venant de d = f(p)/q 2 pour une proportion 1 — o(l) de toutes les valeurs p. On 
peut donc travailler seulement avec des valeurs de d pour lesquelles dy 2 = f(x) a 
(log N)°^ solutions. Ceci n'est pas assez pour prouver le Théo. HU1: on doit considé- 
rer ~ iV(logiV") e valeurs de d, et on veut une borne totale de grandeur o(N/ log N) 
- donc même une borne de 0(1) points par courbe ne serait pas assez. 

Il est alors nécessaire d'éliminer la majorité des valeurs d. Pour faire ceci, on 
montre que, pour p typique, f(p) est dans la queue de la distribution du nombre de 
diviseurs premiers d'un entier, classifiés par leur type de décomposition en Q(a)/Q, 
où a est une racine de f(a) = 0. C'est-à-dire : f(p) n'est divisible par aucun nombre 
premier inerte dans Q(a)/Q, mais, par contre, en moyenne, il est divisible par 3 
fois plus de nombres premiers totalement décomposés qu'un entier moyen. Comme 
f(p) a ces propriétés atypiques, d = f{p)/q 2 (q premier) les a aussi, donc d est 
atypique. Ceci est équivalent à dire que d est dans un ensemble peu nombreux ; cette 
équivalence se quantifie de manière précise avec des bornes de grandes déviations. 

Si le groupe de Galois de Q(a)/Q est le groupe alterné Alt(3), ces bornes sont 
suffisamment fortes pour finir la preuve du Théo. [TU] Ceci est le résultat principal de 
|Hel07| . qui résout aussi le problème analogue pour les valeurs de f(p) (deg(/) = k) 
sans facteurs qui soient puissances (k — l)-èmes, sous l'hypothèse que le groupe de 
Galois de Q(a)/Q soit de haute entropie f |He!07| Thm. 1.1]). 

Si, par contre, le groupe de Galois de Q(a)/Q est le groupe symétrique Sym(3), 
il faut encore montrer que d est atypique d'une autre façon supplémentaire - la 
suivante. Le nombre de points entiers sur y 2 = f(x) mod p est p + O(^fp) (Hasse(- 
Weil)), pas exactement p; la modularité des courbes elliptiques implique que, en 
moyenne, le terme d'erreur O(yfp) est bien présent dans la réalité. Alors, dans la 
moyenne pour la valeur f(n) (n entier ou n premier) a un léger biais en faveur 
ou à l'encontre d'être un carré modulo p. Ces biais s'accumulent, et montrent, à 
nouveau, que, pour n un premier typique, f(n) est atypique. Ceci est assez pour 
réduire notre attention à assez peu de valeurs de d, et le Théorème [TÏÏI est prouvé. 



Chapitre 5 

Combinatoire additive classique 



5.1 Progressions arithmétiques dans les nombres premiers 

Tout ensemble de densité positive dans les entiers contient un nombre infini de 
progressions arithmétiques de longueur 3 (théorème de ROTH |lR ot53] ). Les nombres 
premiers contiennent aussi un nombre infini de progressions arithmétiques de lon- 
gueur 3 (VAN DER CORPUT, basé sur VlNOGRADOV). Il s'agit de deux applications 
de l'analyse de Fourier assez différentes. B. GREEN [Gre05j a prouvé un résultat 
hybride : tout ensemble de densité positive dans les nombres premiers contient un 
nombre infini de progressions arithmétiques de longueur 3. (Ceci précède son travail 
avec Tao, où le même résultat est prouvé pour des progressions de longueur arbitraire 
|GT081 Thm. 1.2].) 

Affaiblir l'hypothèse de densité positive est une tâche difficile pour laquelle le 
progrès est graduel : voir [HB87J, [Sze90j, [Bou99j, [Bou08j, |Sanj (vers la conjecture 
de ErdÔS-Turân) dans le cas de sous-ensembles des entiers. Pour le cas de sous- 
ensembles A de l'ensemble de nombres premiers P, GREEN a prouvé son résultat 
sous l'hypothèse ôp(N) 3> y (log 5 n) / (log 4 n) , où Sp est la densité relative ôp(N) = 
\A fi [l,iV]|/|P n [1,N]\ et log fc est le logarithme réitéré k fois. 

A. DE ROTON et moi avons prouvé le résultat suivant. 

Théorème 11 QHdRllJ). Soit A C P avec densité relative 

C log log log N 

H ' ~ (log log TV) 1 / 3 ' 

où C est une constante absolue. Alors A a une infinité de progressions arithmétiques 
de longueur 3. 

Il s'agit donc d'une amélioration du résultat de Green par deux logarithmes (2 
en place de 4). 

Un des deux logarithmes gagnés vient de l'utilisation de V enveloping sieve, une 
manière d'utiliser des cribles majorants, ainsi nommée dans |Hoo76| ; voir aussi les 
travaux de RAMARÉ [Ram95j, [RROlJ. Cette tactique a été utilisée à partir de [GT08J 
par GREEN et TAO, qui ont contribué à la populariser. 
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Le deuxième log vient d'un aperçu peut-être plus original. Comme il est bien 
connu (au moins depuis Roth), le nombre de progressions arithmétiques dans un 
ensemble S peut s'exprimer de manière naturelle en termes de la transformée de 
Fourier de la fonction caractéristique 1 g de S : 

\{a,de Z:a,a + d,a + 2deS}\=J^ (hsix)^ 2 T s {-2x)dx. 

Cette expression change peu si on replace I5 par sa convoi ution avec une fonction a 
telle que à(ct) ~ 1 quand ls(a) est grand (car alors I5 * a(a) = ls(cv)a(a) ~ ls(a) 
quand ls(a) est grand). Jusqu'à ici, tout est en essence comme dans |Gre05| , De là, 
par contre, il s'avère plus avantageux de travailler dans l'espace physique (plutôt que 
dans l'espace de Fourier, comme dans [Gre05j). Une convolution par a (ou par toute 
autre fonction pas trop grande en norme -^00) ramollit dans le sens £2 l'ensemble P 
des premiers, grâce à des bornes supérieures (fournies par des cribles) sur les auto- 
corrélations de la fonction caractéristique de P. Ceci permet d'extraire de I5 * a un 
ensemble de grande densité en Z, auquel il est possible d'appliquer le théorème de 
Roth, ce qui complète la preuve. 

5.2 Sommes, produits, incidence 

Le théorème de SZEMERÉDI-TROTTER |ST83| borne le nombre d'éléments de 
l'ensemble / d'incidences entre un ensemble P de points et un ensemble L de droites 
dans le plan réel M 2 . (Une incidence est une paire (p,£), où p G P, i G L et p est 
sur £.) Par exemple, dans le cas particulier \L\ ~ \P\ ~ N, la borne |/| < N 2 est 
triviale, la borne |/| <C N 3 / 2 est relativement facile, et la borne |/| <C iV 4//3 fournie 
par Szemerédi-Trotter est en général optimale. 

Il est possible de déduire de |ST83j (a) une borne inférieure sur le nombre de lignes 
déterminées par un ensemble de iV points (théorème de Beck) et (b) un théorème 
de type ERDÔS-SZEMERÉDI, c'est-à-dire, 

mïn(\A- A\,\A + A\) > \A\ 1+S 

pour tout ensemble fini A C Z (5 = 1/4, Elekes [Ele97]). 

Dans le corps fini F p , BOURGAIN, KATZ et TAO |BKT04] ont prouvé une borne 
de type ERDÔS-SZEMERÉDI : 

minflA- A\,\A + A\) > \A\ 1+S (5.2.1) 

pour tout ensemble fini A C ¥ p avec \A\ < p 1_e et une constante 6 > qui dépend 
seulement de e > ("théorème somme-produit" ; ceci comprend la contribution de 
KONYAGIN |Konj ) . Ils arrivent à en déduire une borne de type SZEMERÉDI-TROTTER 
(|/| < jV 3 / 2-<5 ') dans F 2 ; malheureusement, la valeur de ô' > qui résulte n'a pas 
été explicitée, et devrait être minuscule. 

En partant d'un résultat de type (|5.2.ip avec ô > explicite (Ll |Lill| ; voir 
aussi [B G09] et al.), Rudnev et moi avons prouvé |HR11] une version du théorème 



de Beck dans Fp avec un exposant explicite. La preuve repose sur le fait qu'un 
nombre trop élevé de triples de points colinéaires impliquerait un grand nombre de 
relations linéaires, menant après un certain effort à une contradiction avec (15.2, ip . 
Nous avons déduit de ceci un résultat de type SZEMERÉDI-TROTTER avec 5' > 
explicite (<*' = 1/9278). 



Chapitre 6 

Théorie algorithmique des 
nombres 

Il est possible de vérifier en temps polynomial en logn si un nombre n est pre- 
mier. Ceci est classique (Solovay-Strassen, Miller-Rabin, etc.) si on permet des 
algorithmes probabilistes, et connu depuis |AKS04| de manière déterministe. Mais 
comment trouver un nombre premier - entre ./V et 2N, par exemple ? 

Si on permet un algorithme probabiliste, la réponse est évidente : pour trouver 
un nombre premier entre N et 2N, on n'a qu'à prendre un entier entre N et 2N de 
manière aléatoire, et vérifier sa primalité ; c' nombre premier de grandeur ~ N est 
premier avec probabilité ~ 1/ log N, l'algorithme réussira avec probabilité au moins 
1 — e après O e (logn) itérations. Par contre, si seulement des algorithmes déterministes 
sont permis, la question semble devenir très difficile. 

Le travail qui suit a été fait dans le contexte d'un projet Polymath de collaboration 
massive. Par une décision du journal, l'article |TCH] sera publié sous le nom des 
collaborateurs principaux, à savoir, TAO (organisateur), CROOT, et moi-même. 

On pourrait vérifier les entiers N, iV+1, iV + 2, . . . l'un après l'autre, mais - sauf si 
on suppose la conjecture de CRAMER - rien ne garantit l'existence d'un nombre pre- 
mier dans [N, N + M] pour M petit ; même l'hypothèse de Riemann nous donnerait 
ceci seulement pour M > N 1 ^ 2+e . 

Si on pouvait déterminer rapidement si un intervalle [N, N + M] contient des 
nombres premiers, on pourrait trouver facilement un nombre premier dans [iV, 2iV]. 
("J'ai un nombre entre 1 et 100." "Est-ce qu'il est plus grand que 50?", etc.) Si le 
nombre de nombres premiers entre N et 2N est impair, il suffit d'avoir un algorithme 
qui détermine si l'intervalle [N, N+M] contient un nombre pair ou impair de nombres 
premiers. Or 

2 • \{N < p < N + M : p premier}| = T { n ) mod 4, 

N<n<N+M 
n sans diviseurs carrés 

où r(n) est le nombre de diviseurs de n. Le problème se réduit donc à calculer ^ t(ti) 
mod 4, ce qu'on peut faire en calculant ]P 7"(n) de manière complètement précise. 



20 



Le problème de Dirichlet consiste à donner une expression algébrique de 



n<N 

avec un terme d'erreur (inévitablement plutôt grand) à minimiser. GAUSS a prouvé 
0(N 1 ' 2 ), VORONOI (1903) a prouvé 0(N 1 ^ 3 ), . . .. Notre problème consiste à donner 
un algorithme qui calcule Xm<Ar T ( n ) sans terme d'erreur, et à minimiser le temps 
que l'algorithme (malheureusement plutôt lent !) prend. Nous verrons maintenant que 
non seulement les idées de Gauss mais aussi celles de VORONOI et ses contemporains 
(notamment VlNOGRADOV) sont utiles pour cette tâche. 

Comme dans le problème de Dirichlet traditionnel, nous commençons par 



£-(«) = ££i = £ 

n<N n<N d\n d<N 



N 
~d 



aire sous hyperbole y = N/x. 



Par symétrie (Gauss), cette aire est deux fois l'aire sous l'hyperbole y = N/x et à 
gauche de la ligne x = y/N, moins (\fN) 2 = N. Donc il faut calculer ^ d<% /]^[N/d\ . 

Ceci se fait en temps 0(\fN) de manière triviale. Comment faire mieux? 

Nous coupons [0, \/N] en sous-intervalles I de longueur A avec le coût d'un 
facteur \/N / A en temps. Evidemment, Yldei [N/d\ = X^e/ N/d — ^deii^/d} et 
N/d peut être calculé rapidement à la précision nécessaire grâce à EULER- 
MACLAURIN. (On peut se permettre une erreur totale jusqu'à 1/2 dans chaque in- 
tervalle / : l'erreur disparait quand l'approximation de Yldel [N/d\ G Z est arrondie 
à l'entier le plus proche.) Il reste à calculer ^^/{iV/d}. 

Pour A assez petit, d i— > N/d est à peu près linéaire en I. On remplace d h- > N/d 
par une approximation linéaire, avec une approximation diophantienne à (N/do)' = 
—N/d 2 , (do € I) comme pente. On obtient une simple somme linéaire mod q, sauf 
pour quelques cas spéciaux (N/d proche de Z) à identifier et calculer de manière 
individuelle. L'algorithme est rapide et valide pour A <C N 1 / 6 , donc le temps total 
est (JVVa/A) • iV e = N 1 / 3 ^. 

Théorème 12. ( ]TCH\ Thm. 1.2] et fTCH\ §2.1]) La parité du nombre de nombres 
premiers entre N et 2N peut être déterminée en temps O e (iV 1 / 3 ^) pour tout e > 0. 
Si le nombre de nombres premiers entre N et 2N est impair, un nombre premier 
entre N et 2N peut être trouvé de manière déterministe en temps O e (./V 1 / 3 " 4 " 6 ) . 

La condition que |{iV < p < 2N}\ soit impair peut être remplacée par des autres 
conditions similaires - soit en considérant p dans des progressions arithmétiques, soit 
en utilisant la notion de complexité de circuits |TCH| Thm. 1.3]. 



Chapitre 7 

Conclusions et perspectives 



§2. Algorithmes. Disons que nous avons prouvé que le diamètre d'un graphe de 
Cayley T(G, A) est petit. Il reste à voir si ce résultat est ou peut devenir constructif. 
C'est-à-dire : est- il possible de trouver, pour tout g £ G, des éléments ai, a2, ... ,0^ G 
A U A^ 1 tels que a\ ■ ■ ■ d£ = g et £ est petit. Par exemple, un algorithme dans 
un contexte similaire (approximations pour A fixe) existe pour SU (2) (SOLOVAY- 
KlTAEV). En SL2(Z/pZ), par contre, si effectivement il y a un algorithme probabiliste 
(LARSEN [Lar03j), il est valide seulement pour un choix très particulier de A. Tant 
|Hel08a] que les travaux qui le suivent sont non-constructifs. Par contre, il n'est 
encore clair que [HSJ ne puisse devenir constructif - des parties de sa preuve sont 
déjà proches à l'être. 

Même un cas plus basique que SL2(Z/pZ) reste ouvert. Soit G un sous-groupe de 
Borel de SL2(Z/pZ) et A un ensemble de générateurs. Le diamètre de T(G, A) est <C 
(log IGI) ^) grâce à une estimation de KONYAGIN (BUKH et HELFGOTT, non-publié). 
Cette méthode est malheureusement non-constructive. Le problème donc demeure ; 
il se réduit à la question suivante : comment exprimer un élément x G TLjpL comme 
une combinaison linéaire de puissances 1, r, r 2 ,. . ., r^, r donné, £ <C (logp) ^ 1 ), avec 
coefficients <C (logp) 0( - 1 * ) ? (Ceci est clair pour r fixe et p — > 00 ; or le problème 
consiste à en donner une solution valide pour r arbitraire.) 

Diamètre polynomial. Si l'analogue de la proposition [2] est faux pour G = Sym(n) 
et G = Alt(ra), la possibilité qu'il existe une borne polynomiale diam(G) < = 
(log IGI) ^) reste bien réelle. Peuvent les idées en |HS| nous mener à ce but? Une 
fois cette tâche accomplie, il semble plausible que la conjecture de Babai pousse 
être finalement prouvée en général - en particulier, pour les groupes linéaires de 
rang non-borné. 

§3.1 Mon étudiant en thèse (D. MENDES DA Costa) est arrivé à obtenir des 
bornes strictement meilleures que BOMBIERI-PlLA pour les courbes elliptiques sur 
Q définies par une forme courte de Weierstrass. Il est encore à voir si une méthode 
similaire pourrait faire le même pour les courbes de genre > 1. 

§3.2 Le résultat principal de [HVÔ9] a été généralisé aux dimensions n > 2 par 
WALSH [WalJ. Le cas n = 1 reste ouvert. Il est sans doute très difficile, puisque 
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une solution fournirait des résultats de loin plus forts que le grand crible dans la 
majorité de situations. Du travail exploratoire par l'auteur et J. WOLF suggère que 
les (semi-)normes de GOWERS ne sont pas nécessairement le meilleur moyen pour 
la tâche, car elles détectent des (graphes de) fonctions polynomiales plutôt que des 
valeurs polynomiales. 

§4. HEATH-BROWN |HB09| et BROWNING |Broll| ont prouvé l'infinité de valeurs 
de f(p) (deg(/) = k) sans facteurs qui soient puissances (Je — l)-èmes pour k > 5. En 
conséquence, il reste à prouver seulement le cas deg(/) = k = 4, Gai/ égal à Alt (4) 
ou Sym(4). 

§5.1. Des travaux récents par Bateman-Katz |BK| et Sanders |San| suggèrent 
que la conjecture de ERDÔS-Turân pourrait être prouvée dans le futur prévisible. 
Celle-ci impliquerait immédiatement le fait déjà connu de l'existence d'un nombre in- 
fini de progressions arithmétiques de longueur 3 dans tout sous-ensemble des nombres 
premiers de densité relative positive - et pourrait donner des bornes meilleures que 
celles développées en [Gre05j et [HdRllJ. 

§5.2. Il y a des théorèmes d'incidence qui peuvent être prouvés directement dans 
un plan projectif abstrait, sans référence à un corps de base. Ceci est exploré en 
GlLL-HELFGOTT (non-publié) . En particulier, il est possible de prouver une borne 
d'incidence (de type assez différent de Bateman-Katz) dans un plan projectif sans 
l'axiome de Des ARGUES ni celui de PAPPUS. Or dans ce cas il n'y a une structure 
algébrique (corps, anneau) qui corresponde au plan de manière simple et directe. 
Donc il s'agit d'un théorème d'incidence qui n'est pas une paraphrase d'un résultat 
algébrique. 

§6. L'article [TCHJ a montré que des méthodes combinatoires développées pour 
le problème de DlRICHLET peuvent être adaptées à un régime algorithmique. Il reste 
à voir si des méthodes basées sur les sommes exponentielles peuvent être adaptées 
au même régime. (De telles méthodes donnent les meilleures bornes connues pour les 
problème de DlRICHLET.) 
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